
R做數據分析及挖掘培訓
第一章:統計基礎
第一節:描述性統計
1、集中趨勢
2、離散測度
第二節:統計量及其抽樣分布
1、統計量
2、分布
3、樣本均值的分布與中心極限定理
4、樣本比例的抽樣分布
5、兩個樣本均值之差的抽樣分布
6、關于樣本方差的分布
第三節:參數估計
1、參數估計
2、一個總體參數的區間估計
3、兩個總體參數的區間估計
4、估計量的求法
5、樣本量的確定
第四節:假設檢驗 ?
1、假設檢驗、個樣本t檢驗
2、配對樣本的t檢驗、兩獨立樣本t檢驗
第五節:分類數據分析
1、分類數據與卡方統計量
2、擬合優度檢驗
3、列聯分析、獨立性檢驗
4、列聯分析相關測量
5、線性回歸
第六節:矩陣運算
1、行列式
2、矩陣及其運算
3、矩陣的初等變換與線性方程組
4、向量組的線性相關性
5、相似矩陣
6、線性空間與線性變化
第二章:R編程基礎
第一節:R基本知識
1、準備、數據對象
2、運算、讀寫
第二節:R基本語句結構及循環
1、語句結構、創建
2、循環函數
第三節:R數據清洗
1、時間、數據清洗
2、數據清洗
第四節:文本對象處理
1、文本對象處理
2、正則表達式
第五節:R畫圖
1、基本繪圖,圖像格式
2、ggplot2
3、目前好用的擴展
第六節:R統計分析
1、參數估計
2、假設檢驗
第三章:R數據挖掘
第一節:線性回歸,邏輯回歸,梯度下降,聚類,關聯規則,主成分因子分析
第二節:關聯規則,決策樹,神經網絡,貝葉斯,支持向量機,隨機森林
第四章:數據挖掘案例
第一節:如何在保險行業中使用決策樹并展示其成果
第二節:如何在保險行業中使用決策樹并展示其成果
第三節:如何利用客戶分群實現保險行業中潛在客戶的精準定位(K-means)
第四節:基于關聯規則和協同過濾算法的商品個性化推薦